Mamba (apprentissage profond) | StudentB Wikipedia Search

Back Mamba (arquitectura d'aprenentatge profund) Catalan Mamba (deep learning architecture) English

Schéma de description de Mamba dans l'article original

Pour les articles homonymes, voir Mamba.

Mamba est une architecture d'apprentissage profond introduite en décembre 2023 par deux chercheurs de Carnegie Mellon et de Princeton, Albert Gu et Tri Dao^[1]

Mamba s'est rapidement imposé en 2024 comme la principale alternative à l'architecture Transformeur pour le traitement automatique des langues (TAL) et pour les grands modèles de langage comme GPT-3 ou Llama.

↑ (en) Albert Gu et Tri Dao, « Mamba: Linear-Time Sequence Modeling with Selective State Spaces », arXiv:2312.00752 [cs],‎ 2023 (lire en ligne).

Developed by StudentB